”spark 大数据“ 的搜索结果

     park为了解决以往分布式计算框架存在的一些问题(重复计算、资源共享、系统组合),提出了一个分布式数据集的抽象数据模型:RDD(Resilient Distributed Datasets)弹性分布式数据集。

     目录1 Spark 是什么2 Spark 四大特点2.1 速度快2.2 易于使用2.3 通用性强2.4 运行方式3 Spark 框架模块3.1 Spark Core3.2 Spark SQL3.3 Spark Streaming3.4 Spark MLlib3.5 Spark GraphX3.6 Structured Streaming4 ...

     目前,Spark生态系统已经发展成为一个包含多个子项目的集合,其中包含SparkCore、SparkSQL、Spark Streaming、GraphX、MLib、SparkR等子项目,Spark是基于内存计算的大数据并行计算框架。除了扩展了广泛使用的 ...

     spark学习课件,让你深入浅出学习spark。Spark是Hadoop MapReduce的替代方案。MapReudce不适合迭代和交互式任务,Spark主要为交互式查询和迭代算法设计,支持内存存储和高效的容错恢复。Spark拥有MapReduce具有的...

     spark大数据商业实战三部曲完整版,绝对完整!包含后面的13章带目录,并且对每个目录做了准确的目标位置,其它网友上传的只要前18章,内容不全,为此,本人在阅读的过程中亲自整理了笔记,并做上了重点标记,方便...

     2020最新课程,从安装CentOS操作系统到搭建Hadoop2.x集群,结合实际案例一步一步讲解,带你零基础入门。...本套课程包含Hadoop2.x和Spark2.4.0的主要核心知识点,HDFS、MapReduce、Spark RDD Shell与API操作等。

     此外,本书详细介绍了常见的实战问题,比如大数据环境下的配置设置、程序调优等。本书附带的一键安装脚本,更能为初学者提供很大帮助。 【电子版来自互联网,仅供预览及学习交流使用,不可用于商业用途,如有版权问题...

10  
9  
8  
7  
6  
5  
4  
3  
2  
1